13 research outputs found

    Conservation in Mitochondrial DNA: Parallelized Estimation and Alignment Influence

    Get PDF
    The wide availability of sequenced biological data has challenged the conventional methods and tools used in molecular biology to compute the conservation index. As the size of input datasets increases, the time-cost of current conservation methods is becoming unafTordable. We propose a new software tool that combines several estimation methods applied to the conservation computation process with parallelization and divide-and-conquer techniques substantially improving its performance without affecting its accuracy. We have also made an in-depth analysis of the impact of different methods and parameter selection on the alignment process applied to input datasets prior to their conservation analysis. We have used sets of mitochondrial DNA sequences with different levels of heterogeneity and length, to provide a full case study. Both the software tool and the input datasets used in this research are freely available at http://www.zaramit.orglconservation_inde

    Molecular phylogenetic analysis: design and implementation of scalable and reliable algorithms and verification of phylogenetic properties

    Get PDF
    El término bioinformática tiene muchas acepciones, una gran parte referentes a la bioinformática molecular: el conjunto de métodos matemáticos, estadísticos y computacionales que tienen como objetivo dar solución a problemas biológicos, haciendo uso exclusivamente de las secuencias de ADN, ARN y proteínas y su información asociada. La filogenética es el área de la bioinformática encargada del estudio de la relación evolutiva entre organismos de la misma o distintas especies. Al igual que sucedía con la definición anterior, los trabajos realizados a lo largo de esta tesis se centran en la filogenética molecular: la rama de la filogenética que analiza las mutaciones hereditarias en secuencias biológicas (principalmente ADN) para establecer dicha relación evolutiva. El resultado de este análisis se plasma en un árbol evolutivo o filogenia. Una filogenia suele representarse como un árbol con raíz, normalmente binario, en el que las hojas simbolizan los organismos existentes actualmente y, la raíz, su ancestro común. Cada nodo interno representa una mutación que ha dado lugar a una división en la clasificación de los descendientes. Las filogenias se construyen mediante procesos de inferencia en base a la información disponible, que pertenece mayoritariamente a organismos existentes hoy en día. La complejidad de este problema se ha visto reflejada en la clasificación de la mayoría de métodos propuestos para su solución como NP-duros [1-3].El caso real de aplicación de esta tesis ha sido el ADN mitocondrial. Este tipo de secuencias biológicas es relevante debido a que tiene un alto índice de mutación, por lo que incluso filogenias de organismos muy cercanos evolutivamente proporcionan datos significativos para la comunidad biológica. Además, varias mutaciones del ADN mitocondrial humano se han relacionado directamente con enfermedad y patogenias, la mayoría mortales en individuos no natos o de corta edad. En la actualidad hay más de 30000 secuencias disponibles de ADN mitocondrial humano, lo que, además de su utilidad científica, ha permitido el análisis de rendimiento de nuestras contribuciones para datos masivos (Big Data). La reciente incorporación de la bioinformática en la categoría Big Data viene respaldada por la mejora de las técnicas de digitalización de secuencias biológicas que sucedió a principios del siglo 21 [4]. Este cambio aumentó drásticamente el número de secuencias disponibles. Por ejemplo, el número de secuencias de ADN mitocondrial humano pasó de duplicarse cada cuatro años, a hacerlo en menos de dos. Por ello, un gran número de métodos y herramientas usados hasta entonces han quedado obsoletos al no ser capaces de procesar eficientemente estos nuevos volúmenes de datos.Este es motivo por el que todas las aportaciones de esta tesis han sido desarrolladas para poder tratar grandes volúmenes de datos. La contribución principal de esta tesis es un framework que permite diseñar y ejecutar automáticamente flujos de trabajo para la inferencia filogenética: PhyloFlow [5-7]. Su creación fue promovida por el hecho de que la mayoría de sistemas de inferencia filogenética existentes tienen un flujo de trabajo fijo y no se pueden modificar ni las herramientas software que los componen ni sus parámetros. Esta decisión puede afectar negativamente a la precisión del resultado si el flujo del sistema o alguno de sus componentes no está adaptado a la información biológica que se va a utilizar como entrada. Por ello, PhyloFlow incorpora un proceso de configuración que permite seleccionar tanto cada uno de los procesos que formarán parte del sistema final, como las herramientas y métodos específicos y sus parámetros. Se han incluido consejos y opciones por defecto durante el proceso de configuración para facilitar su uso, sobre todo a usuarios nóveles. Además, nuestro framework permite la ejecución desatendida de los sistemas filogenéticos generados, tanto en ordenadores de sobremesa como en plataformas hardware (clusters, computación en la nube, etc.). Finalmente, se han evaluado las capacidades de PhyloFlow tanto en la reproducción de sistemas de inferencia filogenética publicados anteriormente como en la creación de sistemas orientados a problemas intensivos como el de inferencia del ADN mitocondrial humano. Los resultados muestran que nuestro framework no solo es capaz de realizar los retos planteados, sino que, en el caso de la replicación de sistemas, la posibilidad de configurar cada elemento que los componen mejora ampliamente su aplicabilidad.Durante la implementación de PhyloFlow descubrimos varias carencias importantes en algunas bibliotecas software actuales que dificultaron la integración y gestión de las herramientas filogenéticas. Por este motivo se decidió crear la primera biblioteca software en Python para estudios de filogenética molecular: MEvoLib [8]. Esta biblioteca ha sido diseñada para proveer una sola interfaz para los conjuntos de herramientas software orientados al mismo proceso, como el multialineamiento o la inferencia de filogenias. MEvoLib incluye además configuraciones por defecto y métodos que hacen uso de conocimiento biológico específico para mejorar su precisión, adaptándose a las necesidades de cada tipo de usuario. Como última característica relevante, se ha incorporado un proceso de conversión de formatos para los ficheros de entrada y salida de cada interfaz, de forma que, si la herramienta seleccionada no soporta dicho formato, este es adaptado automáticamente. Esta propiedad facilita el uso e integración de MEvoLib en scripts y herramientas software.El estudio del caso de aplicación de PhyloFlow al ADN mitocondrial humano ha expuesto los elevados costes tanto computacionales como económicos asociados a la inferencia de grandes filogenias. Por ello, sistemas como PhyloTree [9], que infiere un tipo especial de filogenias de ADN mitocondrial humano, recalculan sus resultados con una frecuencia máxima anual. Sin embargo, como ya hemos comentado anteriormente, las técnicas de secuenciación actuales permiten la incorporación de cientos o incluso miles de secuencias biológicas nuevas cada mes. Este desfase entre productor y consumidor hace que dichas filogenias queden desactualizadas en unos pocos meses. Para solucionar este problema hemos diseñado un nuevo algoritmo que permite la actualización de una filogenia mediante la incorporación iterativa de nuevas secuencias: PHYSER [10]. Además, la propia información evolutiva se utiliza para detectar posibles mutaciones introducidas artificialmente por el proceso de secuenciación, inexistentes en la secuencia original. Las pruebas realizadas con ADN mitocondrial han probado su eficacia y eficiencia, con un coste temporal por secuencia inferior a los 20 segundos.El desarrollo de nuevas herramientas para el análisis de filogenias también ha sido una parte importante de esta tesis. En concreto, se han realizado dos aportaciones principales en este aspecto: PhyloViewer [11] y una herramienta para el análisis de la conservación [12]. PhyloViewer es un visualizador de filogenias extensivas, es decir, filogenias que poseen al menos un millar de hojas. Esta herramienta aporta una novedosa interfaz en la que se muestra el nodo seleccionado y sus nodos hijo, así como toda la información asociada a cada uno de ellos: identificador, secuencia biológica, ... Esta decisión de diseño ha sido orientada a evitar el habitual “borrón” que se produce en la mayoría de herramientas de visualización al mostrar este tipo de filogenias enteras por pantalla. Además, se ha desarrollado en una arquitectura clienteservidor, con lo que el procesamiento de la filogenia se realiza una única vez por parte el servidor. Así, se ha conseguido reducir significativamente los tiempos de carga y acceso por parte del cliente. Por otro lado, la aportación principal de nuestra herramienta para el análisis de la conservación se basa en la paralelización de los métodos clásicos aplicados en este campo, alcanzando speed-ups cercanos al teórico sin pérdida de precisión. Esto ha sido posible gracias a la implementación de dichos métodos desde cero, incorporando la paralelización a nivel de instrucción, en vez de paralelizar implementaciones existentes. Como resultado, nuestra herramienta genera un informe que contiene las conclusiones del análisis de conservación realizado. El usuario puede introducir un umbral de conservación para que el informe destaque solo aquellas posiciones que no lo cumplan. Además, existen dos tipos de informe con distinto nivel de detalle. Ambos se han diseñado para que sean comprensibles y útiles para los usuarios.Finalmente, se ha diseñado e implementado un predictor de mutaciones patógenas en ADN mitocondrial desarollado en máquinas de vectores de soporte (SVM): Mitoclass.1 [13]. Se trata del primer predictor para este tipo de secuencias biológicas. Tanto es así, que ha sido necesario crear el primer repositorio de mutaciones patógenas conocidas, mdmv.1, para poder entrenar y evaluar nuestro predictor. Se ha demostrado que Mitoclass.1 mejora la clasificación de las mutaciones frente a los predictores más conocidos y utilizados, todos ellos orientados al estudio de patogenicidad en ADN nuclear. Este éxito radica en la novedosa combinación de propiedades a evaluar por cada mutación en el proceso de clasificación. Además, otro factor a destacar es el uso de SVM frente a otras alternativas, que han sido probadas y descartadas debido a su menor capacidad de predicción para nuestro caso de aplicación.REFERENCIAS[1] L. Wang and T. Jiang, “On the complexity of multiple sequence alignment,” Journal of computational biology, vol. 1, no. 4, pp. 337–348, 1994.[2] W. H. E. Day, D. S. Johnson, and D. Sankoff, “The Computational Complexity of Inferring Rooted Phylogenies by Parsimony,” Mathematical Biosciences, vol. 81, no. 1, pp. 33–42, 1986.[3] S. Roch, “A short proof that phylogenetic tree reconstruction by maximum likelihood is hard,” IEEE/ACM Transactions on Computational Biology and Bioinformatics (TCBB), vol. 3, no. 1, p. 92, 2006.[4] E. R. Mardis, “The impact of next-generation sequencing technology on genetics,” Trends in genetics, vol. 24, no. 3, pp. 133–141, 2008.[5] J. Álvarez-Jarreta, G. de Miguel Casado, and E. Mayordomo, “PhyloFlow: A Fully Customizable and Automatic Workflow for Phylogeny Estimation,” in ECCB 2014, 2014.[6] J. Álvarez-Jarreta, G. de Miguel Casado, and E. Mayordomo, “PhyloFlow: A Fully Customizable and Automatic Workflow for Phylogenetic Reconstruction,” in IEEE International Conference on Bioinformatics and Biomedicine (BIBM), pp. 1–7, IEEE, 2014.[7] J. Álvarez, R. Blanco, and E. Mayordomo, “Workflows with Model Selection: A Multilocus Approach to Phylogenetic Analysis,” in 5th International Conference on Practical Applications of Computational Biology & Bioinformatics (PACBB 2011), vol. 93 of Advances in Intelligent and Soft Computing, pp. 39–47, Springer Berlin Heidelberg, 2011.[8] J. Álvarez-Jarreta and E. Ruiz-Pesini, “MEvoLib v1.0: the First Molecular Evolution Library for Python,” BMC Bioinformatics, vol. 17, no. 436, pp. 1–8, 2016.[9] M. van Oven and M. Kayser, “Updated comprehensive phylogenetic tree of global human mitochondrial DNA variation,” Human Mutation, vol. 30, no. 2, pp. E386–E394, 2009.[10] J. Álvarez-Jarreta, E. Mayordomo, and E. Ruiz-Pesini, “PHYSER: An Algorithm to Detect Sequencing Errors from Phylogenetic Information,” in 6th International Conference on Practical Applications of Computational Biology & Bioinformatics (PACBB 2012), pp. 105–112, 2012.[11] J. Álvarez-Jarreta and G. de Miguel Casado, “PhyloViewer: A Phylogenetic Tree Viewer for Extense Phylogenies,” in ECCB 2014, 2014.[12] F. Merino-Casallo, J. Álvarez-Jarreta, and E. Mayordomo, “Conservation in mitochondrial DNA: Parallelized estimation and alignment influence,” in 2015 IEEE International Conference on Bioinformatics and Biomedicine (BIBM 2015), pp. 1434–1440, IEEE, 2015.[13] A. Martín-Navarro, A. Gaudioso-Simón, J. Álvarez-Jarreta, J. Montoya, E. Mayordomo, and E. Ruiz-Pesini, “Machine learning classifier for identification of damaging missense mutations exclusive to human mitochondrial DNA-encoded polypeptides,” BMC Bioinformatics, vol. 18, no. 158, pp. 1–11, 2017.<br /

    Estudio y análisis de métodos de inferencia filogenética: del ADN a las proteínas

    Get PDF
    Los principales objetivos de este proyecto fin de carrera son la traducción de ADN a proteínas, la construcción de árboles filogenéticos utilizando proteínas y su comparación con los árboles construidos directamente a partir de secuencias completas de ADN. La filogenética es la disciplina que estudia las relaciones evolutivas entre distintos individuos o especies. El ADN mitocondrial es un tipo especial de ADN que está almacenado en unos orgánulos de la célula llamados mitocondrias. Parte del ADN mitocondrial codifica proteínas. Los árboles filogenéticos se construyen utilizando modelos matemáticos que intentan explicar la evolución real de los individuos. En el caso tratado de ADN mitocondrial, las filogenias son especialmente útiles a la hora de diagnosticar las mutaciones de un paciente como patógenas. Para poder construir estos árboles es necesario identificar las proteínas dentro de la secuencia de ADN mitocondrial y extraer su información. Debido a la falta de homogeneidad en las bases de datos donde se encuentran almacenadas las secuencias es necesaria una primera fase de procesamiento para así poder localizar las proteínas. La comparación de árboles filogenéticos es un tema abierto y candente en la filogenia computacional para el que no se conocen en la actualidad soluciones satisfactorias, por lo que las herramientas existentes no permiten un análisis profundo de los resultados. Futuros desarrollos en el área de comparación de filogenias serán el punto de partida de posteriores investigaciones a partir de las herramientas y resultados obtenidos en este PFC. En este proyecto se trabaja con árboles filogenéticos construidos mediante proteínas, un tema novedoso en investigación por lo que se espera publicar los resultados en breve y que este proyecto sea el punto de partida de futuros estudios. Durante todo el proyecto se ha tenido que dedicar mucho tiempo a la formación en temas de índole biológica. También se ha usado gran cantidad de herramientas bioinformáticas. Se ha conseguido el objetivo de construir los árboles correspondientes a un total de 4.824 secuencias, un número considerado alto en filogenia computacional dado el gran coste computacional de los métodos empleados. Tras compararlos con los árboles de ADN disponibles se ha llegado a la conclusión que son muy distintos, hecho que puede tener varias explicaciones biológicas y que da pie a nuevas investigaciones para dar explicaciones a este suceso

    Reservoir and vector evolutionary pressures shaped the adaptation of Borrelia

    Get PDF
    The life cycle of spirochetes of the genus Borrelia includes complex networks of vertebrates and ticks. The tripartite association of Borrelia–vertebrate–tick has proved ecologically successful for these bacteria, which have become some of the most prominent tick-borne pathogens in the northern hemisphere. To keep evolutionary pace with its double-host life history, Borrelia must adapt to the evolutionary pressures exerted by both sets of hosts. In this review, we attempt to reconcile functional, phylogenetic, and ecological perspectives to propose a coherent scenario of Borrelia evolution. Available empirical information supports that the association of Borrelia with ticks is very old. The major split between the tick families Argasidae–Ixodidae (dated some 230–290 Mya) resulted in most relapsing fever (Rf) species being restricted to Argasidae and few associated with Ixodidae. A further key event produced the diversification of the Lyme borreliosis (Lb) species: the radiation of ticks of the genus Ixodes from the primitive stock of Ixodidae (around 217 Mya). The ecological interactions of Borrelia demonstrate that Argasidae-transmitted Rf species remain restricted to small niches of one tick species and few vertebrates. The evolutionary pressures on this group are consequently low, and speciation processes seem to be driven by geographical isolation. In contrast to Rf, Lb species circulate in nested networks of dozens of tick species and hundreds of vertebrate species. This greater variety confers a remarkably variable pool of evolutionary pressures, resulting in large speciation of the Lb group, where different species adapt to circulate through different groups of vertebrates. Available data, based on ospA and multilocus sequence typing (including eight concatenated in-house genes) phylogenetic trees, suggest that ticks could constitute a secondary bottleneck that contributes to Lb specialization. Both sets of adaptive pressures contribute to the resilience of highly adaptable meta-populations of bacteria

    Diseño y estudio de herramientas para el análisis del índice de conservación del ADN mitocondrial

    Get PDF
    El objetivo principal de este Proyecto Fin de Carrera es el estudio y desarrollo de herramientas software para calcular de manera automatizada el índice de conservación de conjuntos de secuencias biológicas. Este conjunto de herramientas, pese a poder utilizarse de forma independiente, constituyen un potente sistema cuando se utilizan de forma combinada. El índice de conservación es un estadístico muestral que tiene especial importancia en el estudio de la patogenicidad de mutaciones, el cual consiste en determinar si una mutación puede producir una enfermedad o por el contrario, es inocua al organismo en que se produce. Constituye una de las herramientas de las que disponen los biólogos para realizar los estudios evolutivos. En la actualidad, los esfuerzos realizados por la comunidad científica para automatizar este proceso han producido contadas herramientas web con algunas limitaciones. Sorprende especialmente el no haber encontrado ninguna que permita utilizar este valor estadístico sobre grandes volúmenes de datos como un valioso instrumento adicional en este tipo de estudios. Para resolver este problema, se han implementado una serie de algoritmos haciendo uso de técnicas de programación modular para desarrollar el núcleo del sistema; y pequeñas utilidades para automatizar tareas auxiliares como el tratamiento de los conjuntos de secuencias o los análisis estadísticos requeridos para validar los experimentos realizados. Entre las dificultades encontradas durante el desarrollo de este proyecto cabe destacar la necesidad de formación previa en temas biológicos, ya que no se habían tratado estos temas a lo largo de la carrera. Por otro lado, la necesidad de realizar un tratamiento sobre los conjuntos de secuencias biológicas también implicó importantes esfuerzos en distintas fases del trabajo realizado. Por último, la obtención de información adicional relativa a la división de dichas secuencias para facilitar su análisis supuso un importante obstáculo a resolver en el último tramo del proyecto. Los resultados del sistema diseñado para los conjuntos de secuencias biológicas han sido muy positivos, especialmente teniendo en cuenta el volumen de datos con el que se ha estado trabajando, muy superior al empleado en estudios anteriores. Gracias a la información extraída de los informes generados por el sistema desarrollado se ha podido constatar la presencia de mutaciones ya conocidas por la comunidad bióloga, lo que demuestra la validez de los resultados obtenidos

    Entorno de visualización y edición de árboles para filogenias extensas

    Get PDF
    Este proyecto de fin de carrera aborda el desarrollo de un sistema de visualización web con el que podamos ver y editar arboles, además permite acceder rápidamente a la información que contienen. Como caso particular se trata la visualización de árboles con información de tipo biológico mas concretamente de arboles filogeneticos de ADN mitocondrial

    Bentuk – Bentuk Partisipasi Warga Negara Dalam Pelestarian Lingkungan Hidup Berdasarkan Konsep Green Moral Di Kabupaten Blitar

    Get PDF
    Penelitian ini bertujuan untuk mengkaji dan menganalisa bagaimana bentuk bentuk partisipasi dalam pelestarian lingkungan di Kabupaten Blitar. Metodologi menggunakan pendekatan kualitatif. Hasil penelitian menunjukkan Bentuk-bentuk partisipasi Warga Negara dalam pelestarian lingkungan hidup dilakukan melalui kegiatan-kegiatan masyarakat dan dunia pendidikan (monolitik dan integratif). Kompetensi kewarganegaraan diperlukan agar warga Negara dapat berpartisipasi dalam lingkungan hidup dengan pembekalan dimensi/domain knowledge, skill dan disposition tentang lingkungan hidup melalui berbagai kegiatan di masyarakat dan pendidikan. Bentuk penguatan partisipasi warga Negara dalam Pelestarian Lingkungan Hidup dilakukan melalui kegiatan pelatihan bagi masyarakat, sekolah, sosialisasi tentang lingkungan hidup, penguatan peran organisasi-organisasi relawan lingkungan hidup, serta KMDM di SD dan sekolah SMP.Penguatan partisipasi warga negara tentang pelestarian lingkungan hidup berdasar konsep green moral dalam pembangunan berkelanjutan mengacu pada nilai-nilai Pancasila untuk sopan santun, bersih, mencintai lingkungan, dan menjaga lingkungan hidup untuk tercapai kepekaan terhadap lingkungan hidup melalui adaptasi dari hidup modern dengan mempertahankan dan melindungi lingkungan hidup, tujuan yang jelas dari pelestarian lingkungan hidup, integrasi dari nilai-nilai Pancasila dan lingkungan dalam integrasi berbagai macam kegiatan, serta adanya latency dalam sistem yang dibuat masyarakat dan pemerintah

    Análisis teórico-práctico de métodos de inferencia filogenética basados en selección de modelos y métodos de superárboles.

    No full text
    Este proyecto fin de carrera tiene como objetivo principal el desarrollo de un sistema de inferencia filogenética a partir de secuencias de ADN, utilizando métodos de selección de modelos evolutivos y de construcción de superárboles. La filogenética es la ciencia que trata de establecer la relación evolutiva real entre individuos o especies. Los modelos evolutivos son modelos matemáticos que intentan explicar de la forma más fiel posible la evolución real de los datos a tratar, generando para ello árboles filogenéticos, en los cuales se refleja dicha relación. Los métodos de construcción de superárboles crean estas estructuras a partir de varios árboles filogenéticos cuyas hojas poseen cierto nivel de solapamiento. En la actualidad existen importantes barreras de coste computacional que limitan de forma práctica tanto la realización de filogenias extensivas (muchos de los métodos habituales sólo han sido realmente probados con cientos de secuencias) como la consideración de modelos evolutivos más generales, interesantes y explicativos que el modelo uniforme (estos modelos sólo se han utilizado hasta ahora en tamaños de problema muy reducidos). Las novedades que aporta el proyecto tienen dos vertientes principales: por un lado el desarrollo e implementación de nuevos algoritmos para la construcción de superárboles, y por el otro el desarrollo de un sistema de inferencia filogenética que concentra varios métodos sobre análisis de secuencias y estudio de filogenias que no se habían unido hasta el momento. Especial mención requiere la utilización de flujos de trabajo para la construcción de este sistema, pues nunca habían sido aplicados en este tipo de herramientas. El trabajo desarrollado ha exigido una intensa fase de formación debido a la novedad de los temas biológicos a tratar. De forma entrelazada a esta formación se ha estudiado, diseñado e implementado el sistema mencionado, incorporando como fase final aquellos métodos de superárboles que mejores prestaciones ofrecían. Debido a la utilización de los flujos de trabajo y a la elevada carga computacional que genera el sistema, la selección del marco tecnológico en el que se ha desarrollado ha requerido especial atención. Los resultados tanto del sistema diseñado como de los métodos de superárboles estudiados han sido excelentes en las pruebas realizadas (incluso las realizadas con datos mucho mayores que los que hasta ahora manejaban otro tipo de aplicaciones bioinformáticas), lo que se ha considerado como un rotundo éxito

    Análisis filogenético molecular : diseño e implementación de algoritmos escalables y fiables y verificación automática de propiedades de una filogenia

    No full text
    La filogenética es la ciencia que estudia las relaciones entre organismos basándose en lo cercano que están unos de otros. La forma más visual y conveniente de representar estas relaciones evolutivas entre un grupo de organismos es a través de los árboles filogenéticos. La secuenciación de cadenas biológicas es un proceso mecanizado que permite obtener las secuencias biológicas que se utilizarán para construir estos árboles, que se desarrollan a partir de modelos evolutivos: modelos matemáticos que intentan explicar de la forma más fiel posible la evolución real de dichas secuencias. El análisis filogenético es un proceso formado por distintas etapas, que pueden variar según los objetivos, pero cuya finalidad es siempre la misma: poder reconstruir el árbol filogenético. Estas etapas pueden incluir: estudio de modelos evolutivos, análisis estadístico, alineamiento de secuencias, \ldots Esta tesis de máster tiene como objetivo principal el desarrollo del criterio teórico y herramientas prácticas que permitan llevar a cabo un análisis filogenético completo. Los procesos de secuenciación de cadenas biológicas no están exentos de errores, los cuales pueden aparecer en cualquier parte de la secuencia. Hasta la fecha, todo proceso de verificación de la secuencia requiere la actuación manual de un experto en el campo, lo que, sin duda, es un proceso muy costoso. Por otro lado, actualmente el coste computacional limita de forma práctica tanto la realización de filogenias extensivas (tratando miles y decenas de miles de secuencias) como la aplicación de modelos evolutivos más generales, interesantes y explicativos que el modelo uniforme (que únicamente se utilizan en tamaños de problema reducidos). Las aportaciones de este trabajo abordan tres aspectos específicos: por un lado el desarrollo e implementación de un sistema de inferencia filogenética que concentra varios métodos sobre análisis de secuencias y estudio de filogenias que no se habían unido hasta el momento; por otro lado el desarrollo e implementación de una aplicación para la detección automática de errores de las cadenas obtenidas en los procesos de secuenciación; y por último el estudio teórico de nuevos algoritmos para la caracterización de problemas entre aquellos que se consideran como no resolubles en la actualidad. Los resultados de todo este trabajo han concluido en la creación de dos artículos (uno publicado y otro en fase de revisión). Adicionalmente, hay un tercero que está en fase de desarrollo, lo que refleja el amplio interés en estos temas por la comunidad científica y su utilidad práctica
    corecore